Distance Metrics (Euclidean, Manhattan)

Machine Learning - সাইকিট-লার্ন (Scikit-Learn) - K-Nearest Neighbors (KNN)
231

Distance Metrics মেশিন লার্নিং এবং ডেটা সায়েন্সে ব্যবহৃত গুরুত্বপূর্ণ ধারণা। এটি দুইটি বা তার অধিক পয়েন্টের মধ্যে দূরত্ব পরিমাপ করতে ব্যবহৃত হয়। বিশেষ করে ক্লাস্টারিং, ক্লাসিফিকেশন এবং রিগ্রেশন মডেলগুলিতে ব্যবহৃত হয়, যেমন K-Nearest Neighbors (KNN), K-Means Clustering, এবং Support Vector Machines (SVM)-এ। দুটি জনপ্রিয় এবং গুরুত্বপূর্ণ distance metric হল Euclidean Distance এবং Manhattan Distance


১. Euclidean Distance (ইউক্লিডিয়ান দূরত্ব)

Euclidean Distance হলো সাধারণত ব্যবহৃত নির্মাণমূলক (straight-line) দূরত্ব, যা দুইটি পয়েন্টের মধ্যে সরাসরি (লিনিয়ার) দূরত্ব পরিমাপ করে। এটি পিথাগোরিয়ান থিওরেম ব্যবহার করে হিসাব করা হয়। দুটি পয়েন্টের মধ্যে Euclidean Distance হল দুইটি পয়েন্টের ফিচারগুলির মধ্যে ত্রিকোণমিতিক ফাঁক (hypotenuse)।

ফর্মুলা:

যদি দুইটি পয়েন্ট থাকে:

  • পয়েন্ট ১: P1(x1,y1)P_1(x_1, y_1)
  • পয়েন্ট ২: P2(x2,y2)P_2(x_2, y_2)

তাহলে Euclidean Distance হবে:

d(P1,P2)=(x2x1)2+(y2y1)2d(P_1, P_2) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}

এটি 2D বা 3D স্পেসেও প্রযোজ্য। 3D স্পেসে তিনটি ডাইমেনশন থাকবে:

d(P1,P2)=(x2x1)2+(y2y1)2+(z2z1)2d(P_1, P_2) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2 + (z_2 - z_1)^2}

Euclidean Distance উদাহরণ:

ধরা যাক, পয়েন্ট ১: (1,2)(1, 2) এবং পয়েন্ট ২: (4,6)(4, 6), তাহলে Euclidean Distance হবে:

d=(41)2+(62)2=9+16=25=5d = \sqrt{(4 - 1)^2 + (6 - 2)^2} = \sqrt{9 + 16} = \sqrt{25} = 5

এটি সরল লাইন (স্ট্রেইট লাইন) হিসাবে পরিমাপ করা হয়েছে।


২. Manhattan Distance (ম্যানহ্যাটন দূরত্ব)

Manhattan Distance (বা Taxicab Distance) হলো দুটি পয়েন্টের মধ্যে একাধিক কোণে সরাসরি চলাচল করার মাধ্যমে পরিমাপ করা দূরত্ব। এটি শহরের রাস্তার নেটওয়ার্কের মত কাজ করে, যেখানে আপনি শুধুমাত্র অনুভূমিক বা উল্লম্ব পথে চলতে পারেন এবং এটি এক্স-অক্ষ এবং ওয়াই-অক্ষের মধ্যে মোট পরিমাণ যোগফল হিসাব করা হয়।

ফর্মুলা:

যদি দুইটি পয়েন্ট থাকে:

  • পয়েন্ট ১: P1(x1,y1)P_1(x_1, y_1)
  • পয়েন্ট ২: P2(x2,y2)P_2(x_2, y_2)

তাহলে Manhattan Distance হবে:

d(P1,P2)=x2x1+y2y1d(P_1, P_2) = |x_2 - x_1| + |y_2 - y_1|

এটি 2D অথবা 3D স্পেসেও প্রযোজ্য। 3D স্পেসে Manhattan Distance হবে:

d(P1,P2)=x2x1+y2y1+z2z1d(P_1, P_2) = |x_2 - x_1| + |y_2 - y_1| + |z_2 - z_1|

Manhattan Distance উদাহরণ:

ধরা যাক, পয়েন্ট ১: (1,2)(1, 2) এবং পয়েন্ট ২: (4,6)(4, 6), তাহলে Manhattan Distance হবে:

d=41+62=3+4=7d = |4 - 1| + |6 - 2| = 3 + 4 = 7

এখানে, এটি অনুভূমিক এবং উল্লম্ব পথ ধরে পরিমাপ করা হয়েছে।


Euclidean এবং Manhattan Distance এর মধ্যে পার্থক্য:

বৈশিষ্ট্যEuclidean DistanceManhattan Distance
পদ্ধতিসরাসরি (লিনিয়ার) দূরত্ব পরিমাপঅনুভূমিক এবং উল্লম্ব পথে দূরত্ব পরিমাপ
ফর্মুলা(x2x1)2+(y2y1)2\sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}(
ব্যবহারমেট্রিক স্পেসে সরাসরি দূরত্ব পরিমাপশহর রাস্তা নেটওয়ার্কে বা গ্রিড স্পেসে ব্যবহৃত
আকৃতিকোণযুক্ত সম্পর্কের জন্য বেশি ব্যবহৃতপথের জন্য ব্যবহৃত, যেমন শহরের রাস্তা বা গ্রিড
ব্যবহার ক্ষেত্রসাধারণত উচ্চ মাত্রার ডেটার জন্য ব্যবহৃতকম্পিউটেশনের জন্য সাধারণত ব্যবহার হয়, সহজ এবং দ্রুত
ব্যবহারঅধিকাংশ মেশিন লার্নিং অ্যালগরিদমে ব্যবহৃতKNN, অ্যালগরিদমের জন্য উপযুক্ত, যখন ভিন্ন ভিন্ন রাস্তায় কাজ করতে হয়

সারাংশ:

  • Euclidean Distance দুইটি পয়েন্টের মধ্যে সরাসরি (লিনিয়ার) দূরত্ব পরিমাপ করে এবং এটি সাধারণত ব্যবহৃত হয় যখন দুইটি পয়েন্টের মধ্যে একটি সোজা লাইন অথবা রাস্তা পরিমাপ করা হয়।
  • Manhattan Distance দুইটি পয়েন্টের মধ্যে অনুভূমিক এবং উল্লম্ব পথে চলতে পরিমাপ করা দূরত্ব হিসাব করে, যা শহরের রাস্তা নেটওয়ার্কের মত কাজ করে।

এই দুটি দূরত্ব মেট্রিকের মধ্যে পার্থক্য বুঝতে হলে, তাদের ব্যবহার এবং প্রয়োগের দিক থেকে পার্থক্য উপলব্ধি করা দরকার। Euclidean সাধারণত জ্যামিতিক অবস্থানে এবং Manhattan ব্যবহার করা হয় যখন পথ সীমাবদ্ধ বা নেটওয়ার্কের মাধ্যমে চলাচল করতে হয়।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...